FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5305, 521 aa 1>>>pF1KB5305 521 - 521 aa - 521 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.1404+/-0.00119; mu= 9.1794+/- 0.070 mean_var=148.3685+/-31.808, 0's: 0 Z-trim(106.0): 211 B-trim: 79 in 2/48 Lambda= 0.105294 statistics sampled from 8469 (8710) to 8469 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.639), E-opt: 0.2 (0.268), width: 16 Scan time: 3.260 The best scores are: opt bits E(32554) CCDS59142.1 PRPF4 gene_id:9128|Hs108|chr9 ( 521) 3546 551.3 1e-156 CCDS6791.1 PRPF4 gene_id:9128|Hs108|chr9 ( 522) 3534 549.4 3.5e-156 CCDS2470.1 DAW1 gene_id:164781|Hs108|chr2 ( 415) 520 91.5 2e-18 CCDS6981.1 WDR5 gene_id:11091|Hs108|chr9 ( 334) 441 79.4 6.9e-15 CCDS3012.1 WDR5B gene_id:54554|Hs108|chr3 ( 330) 427 77.3 3e-14 CCDS3230.1 GNB4 gene_id:59345|Hs108|chr3 ( 340) 421 76.4 5.8e-14 CCDS5703.1 GNB2 gene_id:2783|Hs108|chr7 ( 340) 418 75.9 7.9e-14 CCDS34.1 GNB1 gene_id:2782|Hs108|chr1 ( 340) 417 75.8 8.8e-14 CCDS10788.1 KATNB1 gene_id:10300|Hs108|chr16 ( 655) 413 75.4 2.2e-13 CCDS7995.1 PRPF19 gene_id:27339|Hs108|chr11 ( 504) 405 74.1 4.2e-13 CCDS8564.1 GNB3 gene_id:2784|Hs108|chr12 ( 340) 395 72.5 8.9e-13 CCDS73427.1 GNB3 gene_id:2784|Hs108|chr12 ( 339) 388 71.4 1.9e-12 CCDS340.1 SNRNP40 gene_id:9410|Hs108|chr1 ( 357) 387 71.3 2.1e-12 CCDS56341.1 PLRG1 gene_id:5356|Hs108|chr4 ( 505) 388 71.5 2.5e-12 CCDS34083.1 PLRG1 gene_id:5356|Hs108|chr4 ( 514) 388 71.5 2.5e-12 CCDS45261.1 GNB5 gene_id:10681|Hs108|chr15 ( 353) 384 70.8 2.9e-12 CCDS72685.1 GNB1 gene_id:2782|Hs108|chr1 ( 240) 381 70.2 3e-12 CCDS10149.1 GNB5 gene_id:10681|Hs108|chr15 ( 395) 384 70.8 3.2e-12 CCDS54591.1 POC1A gene_id:25886|Hs108|chr3 ( 369) 374 69.3 8.6e-12 CCDS7547.1 TAF5 gene_id:6877|Hs108|chr10 ( 800) 377 70.0 1.1e-11 CCDS54592.1 POC1A gene_id:25886|Hs108|chr3 ( 359) 369 68.5 1.4e-11 CCDS2846.1 POC1A gene_id:25886|Hs108|chr3 ( 407) 369 68.6 1.6e-11 CCDS2396.1 SPAG16 gene_id:79582|Hs108|chr2 ( 631) 369 68.7 2.2e-11 CCDS43876.1 WDR38 gene_id:401551|Hs108|chr9 ( 314) 355 66.4 5.7e-11 CCDS75898.1 WDR38 gene_id:401551|Hs108|chr9 ( 315) 355 66.4 5.7e-11 >>CCDS59142.1 PRPF4 gene_id:9128|Hs108|chr9 (521 aa) initn: 3546 init1: 3546 opt: 3546 Z-score: 2927.2 bits: 551.3 E(32554): 1e-156 Smith-Waterman score: 3546; 100.0% identity (100.0% similar) in 521 aa overlap (1-521:1-521) 10 20 30 40 50 60 pF1KB5 MASSRASSTATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGIE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 MASSRASSTATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGIE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 AGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPITL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 AGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPITL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 FGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLWI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 FGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLWI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 ANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 ANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 NSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 NSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 DGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 DGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQ 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 EGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 EGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB5 IATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 IATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHPG 430 440 450 460 470 480 490 500 510 520 pF1KB5 WSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE ::::::::::::::::::::::::::::::::::::::::: CCDS59 WSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE 490 500 510 520 >>CCDS6791.1 PRPF4 gene_id:9128|Hs108|chr9 (522 aa) initn: 3507 init1: 3507 opt: 3534 Z-score: 2917.4 bits: 549.4 E(32554): 3.5e-156 Smith-Waterman score: 3534; 99.8% identity (99.8% similar) in 522 aa overlap (1-521:1-522) 10 20 30 40 50 pF1KB5 MASSRASST-ATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGI ::::::::: :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 MASSRASSTQATKTKAPDDLVAPVVKKPHIYYGSLEEKERERLAKGESGILGKDGLKAGI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB5 EAGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 EAGNINITSGEVFEIEEHISERQAEVLAEFERRKRARQINVSTDDSEVKACLRALGEPIT 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB5 LFGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 LFGEGPAERRERLRNILSVVGTDALKKTKKDDEKSKKSKEEYQQTWYHEGPNSLKVARLW 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB5 IANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 IANYSLPRAMKRLEEARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB5 PNSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 PNSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCA 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB5 ADGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 ADGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILH 310 320 330 340 350 360 360 370 380 390 400 410 pF1KB5 QEGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 QEGHSMGVYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGY 370 380 390 400 410 420 420 430 440 450 460 470 pF1KB5 HIATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS67 HIATGSGDNTCKVWDLRQRRCVYTIPAHQNLVTGVKFEPIHGNFLLTGAYDNTAKIWTHP 430 440 450 460 470 480 480 490 500 510 520 pF1KB5 GWSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE :::::::::::::::::::::::::::::::::::::::::: CCDS67 GWSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE 490 500 510 520 >>CCDS2470.1 DAW1 gene_id:164781|Hs108|chr2 (415 aa) initn: 643 init1: 331 opt: 520 Z-score: 444.3 bits: 91.5 E(32554): 2e-18 Smith-Waterman score: 532; 30.3% identity (63.5% similar) in 274 aa overlap (239-512:144-408) 210 220 230 240 250 260 pF1KB5 QMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLHTL .: . .::. .. :::::: . ::. CCDS24 RTCKLWDTASGEELNTLEGHRNVVYAIAFNNPYGDKIATGSFDKTCKLWSVETGKCYHTF 120 130 140 150 160 170 270 280 290 300 310 320 pF1KB5 RGHNTNVGAIVFHPKSTVSLDPKDVNLASCAADGSVKLWSLDSDEPVADIEGHTVRVARV :::.... . :.:.::. .:. . : ..:::.... : : ..::.... . CCDS24 RGHTAEIVCLSFNPQSTL--------VATGSMDTTAKLWDIQNGEEVYTLRGHSAEIISL 180 190 200 210 220 330 340 350 360 370 380 pF1KB5 MWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQDGSLAGTGGLDAFG .. :: . : .:.. .:: .. ... :: . . .:. : :: ::..: CCDS24 SFNTSGDRIITGSFDHTVVVWDADTGRKVNILIGHCAEISSASFNWDCSLILTGSMDKTC 230 240 250 260 270 280 390 400 410 420 430 440 pF1KB5 RVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDLRQRRCVYTIPAHQ ..:: .:.:. : :: :: :. .: :::.:.:.: .... :.:. . .:. CCDS24 KLWDATNGKCVATLTGHDDEILDSCFDYTGKLIATASADGTARIFSAATRKCIAKLEGHE 290 300 310 320 330 340 450 460 470 480 490 500 pF1KB5 NLVTGVKFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGKVMGLDISSDGQLIAT . .. ..:.: .:: ::::. :.::.:: . :..: :: .... .. :... : CCDS24 GEISKISFNP-QGNHLLTGSSDKTARIWDAQTGQCLQVLEGHTDEIFSCAFNYKGNIVIT 350 360 370 380 390 400 510 520 pF1KB5 CSYDRTFKLWMAE : : CCDS24 GSKDNTCRIWR 410 >>CCDS6981.1 WDR5 gene_id:11091|Hs108|chr9 (334 aa) initn: 376 init1: 376 opt: 441 Z-score: 380.7 bits: 79.4 E(32554): 6.9e-15 Smith-Waterman score: 449; 26.1% identity (60.6% similar) in 284 aa overlap (228-508:43-318) 200 210 220 230 240 250 pF1KB5 HKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLW : . .: .::::.. ::.. . : :.: CCDS69 ARAQPTPSSSATQSKPTPVKPNYALKFTLAGHTKAVSSVKFSPNGEWLASSSADKLIKIW 20 30 40 50 60 70 260 270 280 290 300 310 pF1KB5 SVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAADGSVKLWSLDSDEPVAD .. : .. .:. ::. ... ... :.. :.: . : ..:.:...: . . CCDS69 GAYDGKFEKTISGHKLGISDVAWSSDSNL--------LVSASDDKTLKIWDVSSGKCLKT 80 90 100 110 120 320 330 340 350 360 370 pF1KB5 IEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQDGS ..::. : ..:.. .. . .:.: :.::... . . .:: : . :..::: CCDS69 LKGHSNYVFCCNFNPQSNLIVSGSFDESVRIWDVKTGKCLKTLPAHSDPVSAVHFNRDGS 130 140 150 160 170 180 380 390 400 410 420 430 pF1KB5 LAGTGGLDAFGRVWDLRTGRCI-MFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDLR : ... :.. :.:: .:.:. ... . ..::::: .: ... ::: :.:: CCDS69 LIVSSSYDGLCRIWDTASGQCLKTLIDDDNPPVSFVKFSPNGKYILAATLDNTLKLWDYS 190 200 210 220 230 240 440 450 460 470 480 490 pF1KB5 QRRCVYTIPAHQNLVTGV--KFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGKV . .:. : .:.: . .: :.....:. :: . ::. .. : :: : CCDS69 KGKCLKTYTGHKNEKYCIFANFSVTGGKWIVSGSEDNLVYIWNLQTKEIVQKLQGHTDVV 250 260 270 280 290 300 500 510 520 pF1KB5 MGLDISSDGQLIATCSYDRTFKLWMAE .. ..::. CCDS69 ISTACHPTENIIASAALENDKTIKLWKSDC 310 320 330 >>CCDS3012.1 WDR5B gene_id:54554|Hs108|chr3 (330 aa) initn: 426 init1: 365 opt: 427 Z-score: 369.3 bits: 77.3 E(32554): 3e-14 Smith-Waterman score: 452; 27.1% identity (58.3% similar) in 288 aa overlap (224-508:35-314) 200 210 220 230 240 250 pF1KB5 EARLHKEIPETTRTSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGL :. .: . .: .::::.. ::.. . : CCDS30 ESRDAKAQLALSSSANQSKEVPENPNYALKCTLVGHTEAVSSVKFSPNGEWLASSSADRL 10 20 30 40 50 60 260 270 280 290 300 310 pF1KB5 CKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAADGSVKLWSLDSDE .:.. : . .:: ::: ... ... :. :.: . : ..:::.. : . CCDS30 IIIWGAYDGKYEKTLYGHNLEISDVAWSSDSS--------RLVSASDDKTLKLWDVRSGK 70 80 90 100 110 320 330 340 350 360 370 pF1KB5 PVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFH . ..::. : ..: . .. . .:.. ..:.... . . .:: : . :. CCDS30 CLKTLKGHSNYVFCCNFNPPSNLIISGSFDETVKIWEVKTGKCLKTLSAHSDPVSAVHFN 120 130 140 150 160 170 380 390 400 410 420 430 pF1KB5 QDGSLAGTGGLDAFGRVWDLRTGRCIMFL-EGHLKEIYGINFSPNGYHIATGSGDNTCKV .::: .:. :.. :.:: .:.:. : . . ..::::: .: :.. ::: :. CCDS30 CSGSLIVSGSYDGLCRIWDAASGQCLKTLVDDDNPPVSFVKFSPNGKYILTATLDNTLKL 180 190 200 210 220 230 440 450 460 470 480 490 pF1KB5 WDLRQRRCVYTIPAHQNLVTGV--KFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGH :: . ::. : .:.: . .: :.....:. :: . ::. .. : :: CCDS30 WDYSRGRCLKTYTGHKNEKYCIFANFSVTGGKWIVSGSEDNLVYIWNLQTKEIVQKLQGH 240 250 260 270 280 290 500 510 520 pF1KB5 EGKVMGLDISSDGQLIATCSYDRTFKLWMAE :.. .:::. CCDS30 TDVVISAACHPTENLIASAALENDKTIKLWMSNH 300 310 320 330 >>CCDS3230.1 GNB4 gene_id:59345|Hs108|chr3 (340 aa) initn: 423 init1: 254 opt: 421 Z-score: 364.2 bits: 76.4 E(32554): 5.8e-14 Smith-Waterman score: 422; 28.1% identity (59.3% similar) in 295 aa overlap (237-518:62-339) 210 220 230 240 250 260 pF1KB5 TSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLH :.. .:..:..: .: .:. : .: CCDS32 QITSNMDSVGRIQMRTRRTLRGHLAKIYAMHWGYDSRLLVSASQDGKLIIWDSYTTNKMH 40 50 60 70 80 90 270 280 290 300 310 320 pF1KB5 TLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA-DGSVKLWSLDSDEPVADIEGHTVRV .. ... : . .. :.. : ..:.. :. ....: . : :. ::: CCDS32 AIPLRSSWVMTCAYAPSG---------NYVACGGLDNICSIYNLKTRE------GN-VRV 100 110 120 130 330 340 350 360 370 pF1KB5 ARVMWHPSG-----RFLG-----TTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQD .: . .: ::: :. : . :::.:. .. ::: :..... : CCDS32 SRELPGHTGYLSCCRFLDDSQIVTSSGDTTCALWDIETAQQTTTFTGHSGDVMSLSLSPD 140 150 160 170 180 190 380 390 400 410 420 430 pF1KB5 GSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDL .:. :: ...::.: : : . . ::...: ...: :::: .:::: : ::...:: CCDS32 MRTFVSGACDASSKLWDIRDGMCRQSFTGHVSDINAVSFFPNGYAFATGSDDATCRLFDL 200 210 220 230 240 250 440 450 460 470 480 490 pF1KB5 RQRRCVYTIPAHQNLVTGVKFEPIH--GNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGK : . . . .:.:.. :. . : .::.: : . ..: . .::::... CCDS32 RADQELL-LYSHDNIICGITSVAFSKSGRLLLAGYDDFNCNVWDTLKGDRAGVLAGHDNR 260 270 280 290 300 310 500 510 520 pF1KB5 VMGLDISSDGQLIATCSYDRTFKLWMAE : : ...::. .:: :.: ...: CCDS32 VSCLGVTDDGMAVATGSWDSFLRIWN 320 330 340 >>CCDS5703.1 GNB2 gene_id:2783|Hs108|chr7 (340 aa) initn: 368 init1: 239 opt: 418 Z-score: 361.7 bits: 75.9 E(32554): 7.9e-14 Smith-Waterman score: 418; 28.8% identity (59.3% similar) in 295 aa overlap (237-518:62-339) 210 220 230 240 250 260 pF1KB5 TSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLH :.. .:..:..: .: .:. : .: CCDS57 QITAGLDPVGRIQMRTRRTLRGHLAKIYAMHWGTDSRLLVSASQDGKLIIWDSYTTNKVH 40 50 60 70 80 90 270 280 290 300 310 320 pF1KB5 TLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA-DGSVKLWSLDSDEPVADIEGHTVRV .. ... : . .. :.. :...:.. :. ...:: . : :. ::: CCDS57 AIPLRSSWVMTCAYAPSG---------NFVACGGLDNICSIYSLKTRE------GN-VRV 100 110 120 130 330 340 350 360 370 pF1KB5 ARVMWHPSG-----RFLG-----TTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQD .: . .: ::: :. : . :::.:. .. . ::: :..... : CCDS57 SRELPGHTGYLSCCRFLDDNQIITSSGDTTCALWDIETGQQTVGFAGHSGDVMSLSLAPD 140 150 160 170 180 190 380 390 400 410 420 430 pF1KB5 GSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDL : .:. :: ..::.: . : . . :: ..: .. : :::: ..::: : ::...:: CCDS57 GRTFVSGACDASIKLWDVRDSMCRQTFIGHESDINAVAFFPNGYAFTTGSDDATCRLFDL 200 210 220 230 240 250 440 450 460 470 480 490 pF1KB5 RQRRCVYTIPAHQNLVTGVKFEPIH--GNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEGK : . . . .:.:.. :. . : .::.: : . .:: . .::::... CCDS57 RADQELL-MYSHDNIICGITSVAFSRSGRLLLAGYDDFNCNIWDAMKGDRAGVLAGHDNR 260 270 280 290 300 310 500 510 520 pF1KB5 VMGLDISSDGQLIATCSYDRTFKLWMAE : : ...::. .:: :.: .:.: CCDS57 VSCLGVTDDGMAVATGSWDSFLKIWN 320 330 340 >>CCDS34.1 GNB1 gene_id:2782|Hs108|chr1 (340 aa) initn: 343 init1: 241 opt: 417 Z-score: 360.9 bits: 75.8 E(32554): 8.8e-14 Smith-Waterman score: 419; 29.4% identity (59.1% similar) in 296 aa overlap (237-518:62-339) 210 220 230 240 250 260 pF1KB5 TSQMQELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLH :.. .:..:..: .: .:. : .: CCDS34 QITNNIDPVGRIQMRTRRTLRGHLAKIYAMHWGTDSRLLVSASQDGKLIIWDSYTTNKVH 40 50 60 70 80 90 270 280 290 300 310 320 pF1KB5 TLRGHNTNVGAIVFHPKSTVSLDPKDVNLASCAA-DGSVKLWSLDSDEPVADIEGHTVRV .. ... : . .. :.. : ..:.. :. ....: . : :. ::: CCDS34 AIPLRSSWVMTCAYAPSG---------NYVACGGLDNICSIYNLKTRE------GN-VRV 100 110 120 130 330 340 350 360 370 pF1KB5 ARVMWHPSG-----RFLG-----TTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQD .: . .: ::: :. : . :::.:. .. ::. :..... : CCDS34 SRELAGHTGYLSCCRFLDDNQIVTSSGDTTCALWDIETGQQTTTFTGHTGDVMSLSLAPD 140 150 160 170 180 190 380 390 400 410 420 430 pF1KB5 GSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDL : .:. :: ...::.: : : . . :: ..: .: : ::: .:::: : ::...:: CCDS34 TRLFVSGACDASAKLWDVREGMCRQTFTGHESDINAICFFPNGNAFATGSDDATCRLFDL 200 210 220 230 240 250 440 450 460 470 480 490 pF1KB5 RQRRCVYTIPAHQNLVTG---VKFEPIHGNFLLTGAYDNTAKIWTHPGWSPLKTLAGHEG : . ..: .:.:.. : :.: : .::.: : . ..: . .::::.. CCDS34 RADQELMTY-SHDNIICGITSVSFSK-SGRLLLAGYDDFNCNVWDALKADRAGVLAGHDN 260 270 280 290 300 310 500 510 520 pF1KB5 KVMGLDISSDGQLIATCSYDRTFKLWMAE .: : ...::. .:: :.: .:.: CCDS34 RVSCLGVTDDGMAVATGSWDSFLKIWN 320 330 340 >>CCDS10788.1 KATNB1 gene_id:10300|Hs108|chr16 (655 aa) initn: 580 init1: 309 opt: 413 Z-score: 353.8 bits: 75.4 E(32554): 2.2e-13 Smith-Waterman score: 413; 28.5% identity (60.4% similar) in 270 aa overlap (241-506:32-286) 220 230 240 250 260 270 pF1KB5 QELHKSLRSLNNFCSQIGDDRPISYCHFSPNSKMLATACWSGLCKLWSVPDCNLLHTLRG ....:::. . .:::. : . .: : CCDS10 ATPVVTKTAWKLQEIVAHASNVSSLVLGKASGRLLATGGDDCRVNLWSINKPNCIMSLTG 10 20 30 40 50 60 280 290 300 310 320 pF1KB5 HNTNVGAIVFHPKSTVSLD-PKDVNLASCAADGSVKLWSLDSDEPVADIEGHTVRVARVM :.. : .: :. :... .:. . .::...:.:.. . . . :: . . . CCDS10 HTS--------PVESVRLNTPEELIVAG-SQSGSIRVWDLEAAKILRTLMGHKANICSLD 70 80 90 100 110 330 340 350 360 370 380 pF1KB5 WHPSGRFLGTTCYDRSWRLWDLEAQEEILHQEGHSMGVYDIAFHQDGSLAGTGGLDAFGR .:: :.:... : . .:::.. . ... .:::..: . : ::. .... : . CCDS10 FHPYGEFVASGSQDTNIKLWDIRRKGCVFRYRGHSQAVRCLRFSPDGKWLASAADDHTVK 120 130 140 150 160 170 390 400 410 420 430 440 pF1KB5 VWDLRTGRCIMFLEGHLKEIYGINFSPNGYHIATGSGDNTCKVWDLRQRRCVYTIPAHQN .::: .:. . . :: . ..: :: : .:.::.: : . :::.. . : : .. . CCDS10 LWDLTAGKMMSEFPGHTGPVNVVEFHPNEYLLASGSSDRTIRFWDLEKFQVVSCIEGEPG 180 190 200 210 220 230 450 460 470 480 490 500 pF1KB5 LVTGVKFEPIHGNFLLTGAYDNTAKIWTHPGWSPLK---TLAGHEGKVMGLDISSDGQLI : .: :.: : : .: :. ... :: : . .. . ::: : : .: ::: CCDS10 PVRSVLFNP-DGCCLYSGCQDSL-RVY---GWEPERCFDVVLVNWGKVADLAICND-QLI 240 250 260 270 280 510 520 pF1KB5 ATCSYDRTFKLWMAE CCDS10 GVAFSQSNVSSYVVDLTRVTRTGTVARDPVQDHRPLAQPLPNPSAPLRRIYERPSTTCSK 290 300 310 320 330 340 >>CCDS7995.1 PRPF19 gene_id:27339|Hs108|chr11 (504 aa) initn: 410 init1: 204 opt: 405 Z-score: 348.8 bits: 74.1 E(32554): 4.2e-13 Smith-Waterman score: 405; 27.5% identity (60.9% similar) in 258 aa overlap (264-518:256-502) 240 250 260 270 280 290 pF1KB5 SYCHFSPNSKMLATACWSGLCKLWSVPDCNLLHTLRGHNTNVGAIVFHPKSTVSLDPKDV .: ::.::. .: ..::::. .:. CCDS79 ALDLCPSDTNKILTGGADKNVVVFDKSSEQILATLKGHTKKVTSVVFHPS-------QDL 230 240 250 260 270 300 310 320 330 340 350 pF1KB5 NLASCAADGSVKLWSLDSDEPVADIEGHTVRVARVMWHPSGRFLGTTCYDRSWRLWDLEA . : . :.....::. . : ...: :. . : .: .: .. :. : . :... CCDS79 -VFSASPDATIRIWSVPNASCVQVVRAHESAVTGLSLHATGDYLLSSSDDQYWAFSDIQT 280 290 300 310 320 330 360 370 380 390 400 410 pF1KB5 QEEILHQEGHSMG--VYDIAFHQDGSLAGTGGLDAFGRVWDLRTGRCIMFLEGHLKEIYG . . . .. : . :: :: . ::: .:. ..:::. . . :: : . CCDS79 GRVLTKVTDETSGCSLTCAQFHPDGLIFGTGTMDSQIKIWDLKERTNVANFPGHSGPITS 340 350 360 370 380 390 420 430 440 450 460 470 pF1KB5 INFSPNGYHIATGSGDNTCKVWDLRQRRCVYTIPAHQNL-VTGVKFEPIHGNFLLTGAYD : :: :::..::.. :.. :.::::. . :. .:. : .. :. :..: :. : CCDS79 IAFSENGYYLATAADDSSVKLWDLRKLKNFKTLQLDNNFEVKSLIFDQ-SGTYLALGGTD 400 410 420 430 440 450 480 490 500 510 520 pF1KB5 NTAKIWTHPGWSPLKTLAGHEGKVMGLDISSDGQLIATCSYDRTFKLWMAE ..:. :. . .. : : . :. .. ...::. ..::..:.. CCDS79 --VQIYICKQWTEILHFTEHSGLTTGVAFGHHAKFIASTGMDRSLKFYSL 460 470 480 490 500 521 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 22:08:25 2016 done: Sun Nov 6 22:08:25 2016 Total Scan time: 3.260 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]