FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5305, 521 aa
1>>>pF1KB5305 521 - 521 aa - 521 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.1404+/-0.00119; mu= 9.1794+/- 0.070
mean_var=148.3685+/-31.808, 0's: 0 Z-trim(106.0): 211 B-trim: 79 in 2/48
Lambda= 0.105294
statistics sampled from 8469 (8710) to 8469 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.639), E-opt: 0.2 (0.268), width: 16
Scan time: 3.260
The best scores are: opt bits E(32554)
CCDS59142.1 PRPF4 gene_id:9128|Hs108|chr9 ( 521) 3546 551.3 1e-156
CCDS6791.1 PRPF4 gene_id:9128|Hs108|chr9 ( 522) 3534 549.4 3.5e-156
CCDS2470.1 DAW1 gene_id:164781|Hs108|chr2 ( 415) 520 91.5 2e-18
CCDS6981.1 WDR5 gene_id:11091|Hs108|chr9 ( 334) 441 79.4 6.9e-15
CCDS3012.1 WDR5B gene_id:54554|Hs108|chr3 ( 330) 427 77.3 3e-14
CCDS3230.1 GNB4 gene_id:59345|Hs108|chr3 ( 340) 421 76.4 5.8e-14
CCDS5703.1 GNB2 gene_id:2783|Hs108|chr7 ( 340) 418 75.9 7.9e-14
CCDS34.1 GNB1 gene_id:2782|Hs108|chr1 ( 340) 417 75.8 8.8e-14
CCDS10788.1 KATNB1 gene_id:10300|Hs108|chr16 ( 655) 413 75.4 2.2e-13
CCDS7995.1 PRPF19 gene_id:27339|Hs108|chr11 ( 504) 405 74.1 4.2e-13
CCDS8564.1 GNB3 gene_id:2784|Hs108|chr12 ( 340) 395 72.5 8.9e-13
CCDS73427.1 GNB3 gene_id:2784|Hs108|chr12 ( 339) 388 71.4 1.9e-12
CCDS340.1 SNRNP40 gene_id:9410|Hs108|chr1 ( 357) 387 71.3 2.1e-12
CCDS56341.1 PLRG1 gene_id:5356|Hs108|chr4 ( 505) 388 71.5 2.5e-12
CCDS34083.1 PLRG1 gene_id:5356|Hs108|chr4 ( 514) 388 71.5 2.5e-12
CCDS45261.1 GNB5 gene_id:10681|Hs108|chr15 ( 353) 384 70.8 2.9e-12
CCDS72685.1 GNB1 gene_id:2782|Hs108|chr1 ( 240) 381 70.2 3e-12
CCDS10149.1 GNB5 gene_id:10681|Hs108|chr15 ( 395) 384 70.8 3.2e-12
CCDS54591.1 POC1A gene_id:25886|Hs108|chr3 ( 369) 374 69.3 8.6e-12
CCDS7547.1 TAF5 gene_id:6877|Hs108|chr10 ( 800) 377 70.0 1.1e-11
CCDS54592.1 POC1A gene_id:25886|Hs108|chr3 ( 359) 369 68.5 1.4e-11
CCDS2846.1 POC1A gene_id:25886|Hs108|chr3 ( 407) 369 68.6 1.6e-11
CCDS2396.1 SPAG16 gene_id:79582|Hs108|chr2 ( 631) 369 68.7 2.2e-11
CCDS43876.1 WDR38 gene_id:401551|Hs108|chr9 ( 314) 355 66.4 5.7e-11
CCDS75898.1 WDR38 gene_id:401551|Hs108|chr9 ( 315) 355 66.4 5.7e-11
>>CCDS59142.1 PRPF4 gene_id:9128|Hs108|chr9 (521 aa)
initn: 3546 init1: 3546 opt: 3546 Z-score: 2927.2 bits: 551.3 E(32554): 1e-156
Smith-Waterman score: 3546; 100.0% identity (100.0% similar) in 521 aa overlap (1-521:1-521)
10 20 30 40 50 60
pF1KB5 MASSRASSTATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 MASSRASSTATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGIE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 AGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPITL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 AGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPITL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 FGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLWI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 FGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLWI
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 ANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 ANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 NSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 NSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 DGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 DGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 EGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 EGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 IATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 IATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHPG
430 440 450 460 470 480
490 500 510 520
pF1KB5 WSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE
:::::::::::::::::::::::::::::::::::::::::
CCDS59 WSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE
490 500 510 520
>>CCDS6791.1 PRPF4 gene_id:9128|Hs108|chr9 (522 aa)
initn: 3507 init1: 3507 opt: 3534 Z-score: 2917.4 bits: 549.4 E(32554): 3.5e-156
Smith-Waterman score: 3534; 99.8% identity (99.8% similar) in 522 aa overlap (1-521:1-522)
10 20 30 40 50
pF1KB5 MASSRASST-ATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGI
::::::::: ::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 MASSRASSTQATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGI
10 20 30 40 50 60
60 70 80 90 100 110
pF1KB5 EAGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPIT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 EAGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPIT
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB5 LFGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 LFGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLW
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB5 IANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 IANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFS
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB5 PNSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 PNSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCA
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB5 ADGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 ADGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILH
310 320 330 340 350 360
360 370 380 390 400 410
pF1KB5 QEGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 QEGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGY
370 380 390 400 410 420
420 430 440 450 460 470
pF1KB5 HIATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS67 HIATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHP
430 440 450 460 470 480
480 490 500 510 520
pF1KB5 GWSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE
::::::::::::::::::::::::::::::::::::::::::
CCDS67 GWSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE
490 500 510 520
>>CCDS2470.1 DAW1 gene_id:164781|Hs108|chr2 (415 aa)
initn: 643 init1: 331 opt: 520 Z-score: 444.3 bits: 91.5 E(32554): 2e-18
Smith-Waterman score: 532; 30.3% identity (63.5% similar) in 274 aa overlap (239-512:144-408)
210 220 230 240 250 260
pF1KB5 QMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLHTL
.: . .::. .. :::::: . ::.
CCDS24 RTCKLWDTASGEELNTLEGHRNVVYAIAFNNPYGDKIATGSFDKTCKLWSVETGKCYHTF
120 130 140 150 160 170
270 280 290 300 310 320
pF1KB5 RGHNTNVGAIVFHPKSTVSLDPKDVNLASCAADGSVKLWSLDSDEPVADIEGHTVRVARV
:::.... . :.:.::. .:. . : ..:::.... : : ..::.... .
CCDS24 RGHTAEIVCLSFNPQSTL--------VATGSMDTTAKLWDIQNGEEVYTLRGHSAEIISL
180 190 200 210 220
330 340 350 360 370 380
pF1KB5 MWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQDGSLAGTGGLDAFG
.. :: . : .:.. .:: .. ... :: . . .:. : :: ::..:
CCDS24 SFNTSGDRIITGSFDHTVVVWDADTGRKVNILIGHCAEISSASFNWDCSLILTGSMDKTC
230 240 250 260 270 280
390 400 410 420 430 440
pF1KB5 RVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDLRQRRCVYTIPAHQ
..:: .:.:. : :: :: :. .: :::.:.:.: .... :.:. . .:.
CCDS24 KLWDATNGKCVATLTGHDDEILDSCFDYTGKLIATASADGTARIFSAATRKCIAKLEGHE
290 300 310 320 330 340
450 460 470 480 490 500
pF1KB5 NLVTGVKFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGKVMGLDISSDGQLIAT
. .. ..:.: .:: ::::. :.::.:: . :..: :: .... .. :... :
CCDS24 GEISKISFNP-QGNHLLTGSSDKTARIWDAQTGQCLQVLEGHTDEIFSCAFNYKGNIVIT
350 360 370 380 390 400
510 520
pF1KB5 CSYDRTFKLWMAE
: :
CCDS24 GSKDNTCRIWR
410
>>CCDS6981.1 WDR5 gene_id:11091|Hs108|chr9 (334 aa)
initn: 376 init1: 376 opt: 441 Z-score: 380.7 bits: 79.4 E(32554): 6.9e-15
Smith-Waterman score: 449; 26.1% identity (60.6% similar) in 284 aa overlap (228-508:43-318)
200 210 220 230 240 250
pF1KB5 HKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLW
: . .: .::::.. ::.. . : :.:
CCDS69 ARAQPTPSSSATQSKPTPVKPNYALKFTLAGHTKAVSSVKFSPNGEWLASSSADKLIKIW
20 30 40 50 60 70
260 270 280 290 300 310
pF1KB5 SVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAADGSVKLWSLDSDEPVAD
.. : .. .:. ::. ... ... :.. :.: . : ..:.:...: . .
CCDS69 GAYDGKFEKTISGHKLGISDVAWSSDSNL--------LVSASDDKTLKIWDVSSGKCLKT
80 90 100 110 120
320 330 340 350 360 370
pF1KB5 IEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQDGS
..::. : ..:.. .. . .:.: :.::... . . .:: : . :..:::
CCDS69 LKGHSNYVFCCNFNPQSNLIVSGSFDESVRIWDVKTGKCLKTLPAHSDPVSAVHFNRDGS
130 140 150 160 170 180
380 390 400 410 420 430
pF1KB5 LAGTGGLDAFGRVWDLRTGRCI-MFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDLR
: ... :.. :.:: .:.:. ... . ..::::: .: ... ::: :.::
CCDS69 LIVSSSYDGLCRIWDTASGQCLKTLIDDDNPPVSFVKFSPNGKYILAATLDNTLKLWDYS
190 200 210 220 230 240
440 450 460 470 480 490
pF1KB5 QRRCVYTIPAHQNLVTGV--KFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGKV
. .:. : .:.: . .: :.....:. :: . ::. .. : :: :
CCDS69 KGKCLKTYTGHKNEKYCIFANFSVTGGKWIVSGSEDNLVYIWNLQTKEIVQKLQGHTDVV
250 260 270 280 290 300
500 510 520
pF1KB5 MGLDISSDGQLIATCSYDRTFKLWMAE
.. ..::.
CCDS69 ISTACHPTENIIASAALENDKTIKLWKSDC
310 320 330
>>CCDS3012.1 WDR5B gene_id:54554|Hs108|chr3 (330 aa)
initn: 426 init1: 365 opt: 427 Z-score: 369.3 bits: 77.3 E(32554): 3e-14
Smith-Waterman score: 452; 27.1% identity (58.3% similar) in 288 aa overlap (224-508:35-314)
200 210 220 230 240 250
pF1KB5 EARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGL
:. .: . .: .::::.. ::.. . :
CCDS30 ESRDAKAQLALSSSANQSKEVPENPNYALKCTLVGHTEAVSSVKFSPNGEWLASSSADRL
10 20 30 40 50 60
260 270 280 290 300 310
pF1KB5 CKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAADGSVKLWSLDSDE
.:.. : . .:: ::: ... ... :. :.: . : ..:::.. : .
CCDS30 IIIWGAYDGKYEKTLYGHNLEISDVAWSSDSS--------RLVSASDDKTLKLWDVRSGK
70 80 90 100 110
320 330 340 350 360 370
pF1KB5 PVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFH
. ..::. : ..: . .. . .:.. ..:.... . . .:: : . :.
CCDS30 CLKTLKGHSNYVFCCNFNPPSNLIISGSFDETVKIWEVKTGKCLKTLSAHSDPVSAVHFN
120 130 140 150 160 170
380 390 400 410 420 430
pF1KB5 QDGSLAGTGGLDAFGRVWDLRTGRCIMFL-EGHLKEIYGINFSPNGYHIATGSGDNTCKV
.::: .:. :.. :.:: .:.:. : . . ..::::: .: :.. ::: :.
CCDS30 CSGSLIVSGSYDGLCRIWDAASGQCLKTLVDDDNPPVSFVKFSPNGKYILTATLDNTLKL
180 190 200 210 220 230
440 450 460 470 480 490
pF1KB5 WDLRQRRCVYTIPAHQNLVTGV--KFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGH
:: . ::. : .:.: . .: :.....:. :: . ::. .. : ::
CCDS30 WDYSRGRCLKTYTGHKNEKYCIFANFSVTGGKWIVSGSEDNLVYIWNLQTKEIVQKLQGH
240 250 260 270 280 290
500 510 520
pF1KB5 EGKVMGLDISSDGQLIATCSYDRTFKLWMAE
:.. .:::.
CCDS30 TDVVISAACHPTENLIASAALENDKTIKLWMSNH
300 310 320 330
>>CCDS3230.1 GNB4 gene_id:59345|Hs108|chr3 (340 aa)
initn: 423 init1: 254 opt: 421 Z-score: 364.2 bits: 76.4 E(32554): 5.8e-14
Smith-Waterman score: 422; 28.1% identity (59.3% similar) in 295 aa overlap (237-518:62-339)
210 220 230 240 250 260
pF1KB5 TSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLH
:.. .:..:..: .: .:. : .:
CCDS32 QITSNMDSVGRIQMRTRRTLRGHLAKIYAMHWGYDSRLLVSASQDGKLIIWDSYTTNKMH
40 50 60 70 80 90
270 280 290 300 310 320
pF1KB5 TLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA-DGSVKLWSLDSDEPVADIEGHTVRV
.. ... : . .. :.. : ..:.. :. ....: . : :. :::
CCDS32 AIPLRSSWVMTCAYAPSG---------NYVACGGLDNICSIYNLKTRE------GN-VRV
100 110 120 130
330 340 350 360 370
pF1KB5 ARVMWHPSG-----RFLG-----TTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQD
.: . .: ::: :. : . :::.:. .. ::: :..... :
CCDS32 SRELPGHTGYLSCCRFLDDSQIVTSSGDTTCALWDIETAQQTTTFTGHSGDVMSLSLSPD
140 150 160 170 180 190
380 390 400 410 420 430
pF1KB5 GSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDL
.:. :: ...::.: : : . . ::...: ...: :::: .:::: : ::...::
CCDS32 MRTFVSGACDASSKLWDIRDGMCRQSFTGHVSDINAVSFFPNGYAFATGSDDATCRLFDL
200 210 220 230 240 250
440 450 460 470 480 490
pF1KB5 RQRRCVYTIPAHQNLVTGVKFEPIH--GNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGK
: . . . .:.:.. :. . : .::.: : . ..: . .::::...
CCDS32 RADQELL-LYSHDNIICGITSVAFSKSGRLLLAGYDDFNCNVWDTLKGDRAGVLAGHDNR
260 270 280 290 300 310
500 510 520
pF1KB5 VMGLDISSDGQLIATCSYDRTFKLWMAE
: : ...::. .:: :.: ...:
CCDS32 VSCLGVTDDGMAVATGSWDSFLRIWN
320 330 340
>>CCDS5703.1 GNB2 gene_id:2783|Hs108|chr7 (340 aa)
initn: 368 init1: 239 opt: 418 Z-score: 361.7 bits: 75.9 E(32554): 7.9e-14
Smith-Waterman score: 418; 28.8% identity (59.3% similar) in 295 aa overlap (237-518:62-339)
210 220 230 240 250 260
pF1KB5 TSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLH
:.. .:..:..: .: .:. : .:
CCDS57 QITAGLDPVGRIQMRTRRTLRGHLAKIYAMHWGTDSRLLVSASQDGKLIIWDSYTTNKVH
40 50 60 70 80 90
270 280 290 300 310 320
pF1KB5 TLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA-DGSVKLWSLDSDEPVADIEGHTVRV
.. ... : . .. :.. :...:.. :. ...:: . : :. :::
CCDS57 AIPLRSSWVMTCAYAPSG---------NFVACGGLDNICSIYSLKTRE------GN-VRV
100 110 120 130
330 340 350 360 370
pF1KB5 ARVMWHPSG-----RFLG-----TTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQD
.: . .: ::: :. : . :::.:. .. . ::: :..... :
CCDS57 SRELPGHTGYLSCCRFLDDNQIITSSGDTTCALWDIETGQQTVGFAGHSGDVMSLSLAPD
140 150 160 170 180 190
380 390 400 410 420 430
pF1KB5 GSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDL
: .:. :: ..::.: . : . . :: ..: .. : :::: ..::: : ::...::
CCDS57 GRTFVSGACDASIKLWDVRDSMCRQTFIGHESDINAVAFFPNGYAFTTGSDDATCRLFDL
200 210 220 230 240 250
440 450 460 470 480 490
pF1KB5 RQRRCVYTIPAHQNLVTGVKFEPIH--GNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGK
: . . . .:.:.. :. . : .::.: : . .:: . .::::...
CCDS57 RADQELL-MYSHDNIICGITSVAFSRSGRLLLAGYDDFNCNIWDAMKGDRAGVLAGHDNR
260 270 280 290 300 310
500 510 520
pF1KB5 VMGLDISSDGQLIATCSYDRTFKLWMAE
: : ...::. .:: :.: .:.:
CCDS57 VSCLGVTDDGMAVATGSWDSFLKIWN
320 330 340
>>CCDS34.1 GNB1 gene_id:2782|Hs108|chr1 (340 aa)
initn: 343 init1: 241 opt: 417 Z-score: 360.9 bits: 75.8 E(32554): 8.8e-14
Smith-Waterman score: 419; 29.4% identity (59.1% similar) in 296 aa overlap (237-518:62-339)
210 220 230 240 250 260
pF1KB5 TSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLH
:.. .:..:..: .: .:. : .:
CCDS34 QITNNIDPVGRIQMRTRRTLRGHLAKIYAMHWGTDSRLLVSASQDGKLIIWDSYTTNKVH
40 50 60 70 80 90
270 280 290 300 310 320
pF1KB5 TLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA-DGSVKLWSLDSDEPVADIEGHTVRV
.. ... : . .. :.. : ..:.. :. ....: . : :. :::
CCDS34 AIPLRSSWVMTCAYAPSG---------NYVACGGLDNICSIYNLKTRE------GN-VRV
100 110 120 130
330 340 350 360 370
pF1KB5 ARVMWHPSG-----RFLG-----TTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQD
.: . .: ::: :. : . :::.:. .. ::. :..... :
CCDS34 SRELAGHTGYLSCCRFLDDNQIVTSSGDTTCALWDIETGQQTTTFTGHTGDVMSLSLAPD
140 150 160 170 180 190
380 390 400 410 420 430
pF1KB5 GSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDL
: .:. :: ...::.: : : . . :: ..: .: : ::: .:::: : ::...::
CCDS34 TRLFVSGACDASAKLWDVREGMCRQTFTGHESDINAICFFPNGNAFATGSDDATCRLFDL
200 210 220 230 240 250
440 450 460 470 480 490
pF1KB5 RQRRCVYTIPAHQNLVTG---VKFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEG
: . ..: .:.:.. : :.: : .::.: : . ..: . .::::..
CCDS34 RADQELMTY-SHDNIICGITSVSFSK-SGRLLLAGYDDFNCNVWDALKADRAGVLAGHDN
260 270 280 290 300 310
500 510 520
pF1KB5 KVMGLDISSDGQLIATCSYDRTFKLWMAE
.: : ...::. .:: :.: .:.:
CCDS34 RVSCLGVTDDGMAVATGSWDSFLKIWN
320 330 340
>>CCDS10788.1 KATNB1 gene_id:10300|Hs108|chr16 (655 aa)
initn: 580 init1: 309 opt: 413 Z-score: 353.8 bits: 75.4 E(32554): 2.2e-13
Smith-Waterman score: 413; 28.5% identity (60.4% similar) in 270 aa overlap (241-506:32-286)
220 230 240 250 260 270
pF1KB5 QELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLHTLRG
....:::. . .:::. : . .: :
CCDS10 ATPVVTKTAWKLQEIVAHASNVSSLVLGKASGRLLATGGDDCRVNLWSINKPNCIMSLTG
10 20 30 40 50 60
280 290 300 310 320
pF1KB5 HNTNVGAIVFHPKSTVSLD-PKDVNLASCAADGSVKLWSLDSDEPVADIEGHTVRVARVM
:.. : .: :. :... .:. . .::...:.:.. . . . :: . . .
CCDS10 HTS--------PVESVRLNTPEELIVAG-SQSGSIRVWDLEAAKILRTLMGHKANICSLD
70 80 90 100 110
330 340 350 360 370 380
pF1KB5 WHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQDGSLAGTGGLDAFGR
.:: :.:... : . .:::.. . ... .:::..: . : ::. .... : .
CCDS10 FHPYGEFVASGSQDTNIKLWDIRRKGCVFRYRGHSQAVRCLRFSPDGKWLASAADDHTVK
120 130 140 150 160 170
390 400 410 420 430 440
pF1KB5 VWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDLRQRRCVYTIPAHQN
.::: .:. . . :: . ..: :: : .:.::.: : . :::.. . : : .. .
CCDS10 LWDLTAGKMMSEFPGHTGPVNVVEFHPNEYLLASGSSDRTIRFWDLEKFQVVSCIEGEPG
180 190 200 210 220 230
450 460 470 480 490 500
pF1KB5 LVTGVKFEPIHGNFLLTGAYDNTAKIWTHPGWSPLK---TLAGHEGKVMGLDISSDGQLI
: .: :.: : : .: :. ... :: : . .. . ::: : : .: :::
CCDS10 PVRSVLFNP-DGCCLYSGCQDSL-RVY---GWEPERCFDVVLVNWGKVADLAICND-QLI
240 250 260 270 280
510 520
pF1KB5 ATCSYDRTFKLWMAE
CCDS10 GVAFSQSNVSSYVVDLTRVTRTGTVARDPVQDHRPLAQPLPNPSAPLRRIYERPSTTCSK
290 300 310 320 330 340
>>CCDS7995.1 PRPF19 gene_id:27339|Hs108|chr11 (504 aa)
initn: 410 init1: 204 opt: 405 Z-score: 348.8 bits: 74.1 E(32554): 4.2e-13
Smith-Waterman score: 405; 27.5% identity (60.9% similar) in 258 aa overlap (264-518:256-502)
240 250 260 270 280 290
pF1KB5 SYCHFSPNSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDV
.: ::.::. .: ..::::. .:.
CCDS79 ALDLCPSDTNKILTGGADKNVVVFDKSSEQILATLKGHTKKVTSVVFHPS-------QDL
230 240 250 260 270
300 310 320 330 340 350
pF1KB5 NLASCAADGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEA
. : . :.....::. . : ...: :. . : .: .: .. :. : . :...
CCDS79 -VFSASPDATIRIWSVPNASCVQVVRAHESAVTGLSLHATGDYLLSSSDDQYWAFSDIQT
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB5 QEEILHQEGHSMG--VYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYG
. . . .. : . :: :: . ::: .:. ..:::. . . :: : .
CCDS79 GRVLTKVTDETSGCSLTCAQFHPDGLIFGTGTMDSQIKIWDLKERTNVANFPGHSGPITS
340 350 360 370 380 390
420 430 440 450 460 470
pF1KB5 INFSPNGYHIATGSGDNTCKVWDLRQRRCVYTIPAHQNL-VTGVKFEPIHGNFLLTGAYD
: :: :::..::.. :.. :.::::. . :. .:. : .. :. :..: :. :
CCDS79 IAFSENGYYLATAADDSSVKLWDLRKLKNFKTLQLDNNFEVKSLIFDQ-SGTYLALGGTD
400 410 420 430 440 450
480 490 500 510 520
pF1KB5 NTAKIWTHPGWSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE
..:. :. . .. : : . :. .. ...::. ..::..:..
CCDS79 --VQIYICKQWTEILHFTEHSGLTTGVAFGHHAKFIASTGMDRSLKFYSL
460 470 480 490 500
521 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 22:08:25 2016 done: Sun Nov 6 22:08:25 2016
Total Scan time: 3.260 Total Display time: 0.050
Function used was FASTA [36.3.4 Apr, 2011]